سیستم رتبه‌بندی ClusterMAX™ برای ابر GPU | چگونه GPU اجاره کنیم

پوشش بیش از ۹۰٪ ارزش بازار اجاره GPU، دستورالعمل‌های ارزیابی ابر GPU، به‌روزرسانی قیمت‌ها، ترکیدن حباب GPU، عرضه اولیه سهام CoreWeave، ابرمقیاس‌پذیرها، اقتصاد نئوکلاد هوش مصنوعی، نرخ بازده داخلی نئوکلاد

مقدمه

سیستم رتبه‌بندی ClusterMAX™ و محتوای این مقاله به‌طور مستقل توسط SemiAnalysis تهیه شده است. هیچ بخشی از پاداش SemiAnalysis توسط مشتریان ما، به‌طور مستقیم یا غیرمستقیم به رتبه‌بندی‌ها، امتیازات یا نظرات خاص بیان‌شده مرتبط نبوده، نیست و نخواهد بود.

شور و هیجان در بازار اجاره واحد پردازش گرافیکی (GPU) فروکش کرده است. ما این موضوع را در گزارش اقتصاد ابر GPU در دسامبر ۲۰۲۳ پیش‌بینی کردیم و این دیدگاه را در گزارش آناتومی و راهنمای نئوکلاد هوش مصنوعی (AI Neocloud) که در اکتبر ۲۰۲۴ منتشر شد، تکرار کردیم. بهبودهای فناورانه به این معنی است که هزینه محاسبات به مرور زمان کاهش می‌یابد و اکنون معتقدیم که بازار به نفع خریداران GPUهای اجاره‌ای است، به‌ویژه برای کلاس Hopper و کلاس MI300. دسترسی گسترده‌ای از بیش از ۱۰۰ نئوکلاد هوش مصنوعی و ابرمقیاس‌پذیر (Hyperscaler) وجود دارد.

بخشی از این امر به دلیل ورود بازیگران جدید و گزینه‌های بیشتر برای اجاره است. در حال حاضر، هیچ «راهنمای چگونگی» برای اجاره GPU یا ارزیابی مستقلی از ابرهای GPU تا به امروز وجود نداشته است.

در ۱۲ ماه گذشته، ما زمان صرف ایجاد سیستم رتبه‌بندی ClusterMAX™ ابر GPU، یا به اختصار ClusterMAX™ کرده‌ایم. ما به‌طور مستقل تا حد امکان ابرهای GPU را آزمایش کرده و/یا بازخورد مشتریان را جمع‌آوری کرده‌ایم. ما معتقدیم که با این اولین رتبه‌بندی ابر GPU، ۹۰٪ از بازار اجاره GPU را بر اساس حجم GPU پوشش خواهیم داد. امیدواریم در تمرین رتبه‌بندی بعدی خود، ارائه‌دهندگان بیشتری را شامل شویم تا بتوانیم کیفیت آنها را ارزیابی کنیم.

رتبه‌بندی نئوکلادها بر اساس سیستم ClusterMAX™ - SemiAnalysis
منبع: SemiAnalysis

این لیست جامعی از ارائه‌دهندگان GPU نیست. ما لیست بسیار گسترده‌تری از بازیگرانی که از آنها آگاه هستیم داریم و کل نقشه بازار در تصویر زیر نشان داده شده است. به نظر می‌رسد این لیست روزانه در حال گسترش است، اما بسیاری از نئوکلادها هنوز برای مشتریان آماده نیستند. این هدف ClusterMAX™ است، زیرا ابزاری ساده برای کمک به شما در پیمایش پیچیدگی است. احتمالاً ارزش دارد که پول خود را صرف یک ارائه‌دهنده دارای رتبه ClusterMAX™ کنید.

نقشه بازار ارائه‌دهندگان نئوکلاد بر اساس نوع - SemiAnalysis
منبع: SemiAnalysis

طبقه‌بندی‌های رتبه‌بندی ما عبارتند از: پلاتینیوم (Platinum)، طلا (Gold)، نقره (Silver)، برنز (Bronze) و عملکرد ضعیف (UnderPerform). در ادامه این گزارش، هر رتبه را با جزئیات بیشتری توضیح خواهیم داد.

علاوه بر این، ما همچنین در مورد بازار اجاره H100، مسیر آینده آن، قیمت‌گذاری ابرمقیاس‌پذیرها در مقابل نئوکلادها، هزینه کل مالکیت (TCO) در سطح خوشه، بازده خوشه و تحلیل سناریو، بحث‌های مختلف پیرامون تقاضا، و اعمال این چارچوب/تحلیل بر روی CoreWeave و عرضه اولیه عمومی (IPO) آن بحث خواهیم کرد.

نشان‌های رتبه‌بندی ClusterMAX™ (پلاتینیوم، طلا، نقره، برنز، عملکرد ضعیف) - SemiAnalysis
منبع: SemiAnalysis

خلاصه اجرایی

  1. SemiAnalysis اولین سیستم رتبه‌بندی ابر GPU جهان را توسعه داده است – ما این سیستم را ClusterMAX™ نامیده‌ایم. ما به رتبه‌بندی GPUها از دیدگاه یک مشتری متوسط و منطقی نگاه می‌کنیم.
  2. SemiAnalysis به‌طور مستقل ده‌ها GPU را آزمایش کرده است و ClusterMAX™ در حال حاضر تقریباً ۹۰٪ از کل بازار GPU را بر اساس حجم GPU پوشش می‌دهد.
  3. استاندارد در سراسر صنعت ابر GPU در حال حاضر بسیار پایین است. هدف ClusterMAX™ ارائه مجموعه‌ای از دستورالعمل‌ها برای کمک به بالا بردن استاندارد در کل صنعت ابر GPU است. دستورالعمل‌های ClusterMAX™ ویژگی‌هایی را ارزیابی می‌کنند که اکثر اجاره‌کنندگان GPU به آنها اهمیت می‌دهند.
  4. ClusterMAX™ دارای پنج سطح مختلف است: پلاتینیوم، طلا، نقره، برنز و عملکرد ضعیف.
  5. ما تمرینات رتبه‌بندی و ارزیابی ClusterMAX™ را به‌طور منظم هر ۳-۶ ماه یکبار انجام خواهیم داد تا بهبودهای GPUهای مختلف منعکس شود و مشتریان بتوانند آخرین اطلاعات در مورد GPUها را داشته باشند.
  6. ClusterMAX™ Platinum نشان‌دهنده ابرهای GPU است که استاندارد صنعت را بالا می‌برند و تنها یک ابر GPU، یعنی CoreWeave، وجود دارد که خدماتی در این سطح ارائه می‌دهد.
  7. CoreWeave در حال حاضر تنها شرکت غیر ابرمقیاس‌پذیر است که در بهره‌برداری قابل اعتماد از خوشه‌های H100 در مقیاس بزرگ (بیش از ۱۰ هزار) تجربه دارد.
  8. برخی از ارائه‌دهندگان در دسته ClusterMAX™ Bronze، مانند Google Cloud، در حال حاضر تلاش قابل توجهی برای رسیدن به سطح بالاتر انجام می‌دهند. ما معتقدیم Google Cloud در مسیر سریعی به سمت ClusterMAX™ Gold یا ClusterMAX™ Platinum تا زمان ارزیابی مجدد بعدی ما قرار دارد.
  9. شرکت‌های بزرگ عمدتاً GPUها را از ابرمقیاس‌پذیرها + CoreWeave اجاره می‌کنند. شرکت‌های بزرگ به ندرت از نئوکلادهای نوظهور اجاره می‌کنند.
  10. قیمت اجاره GPU ابرمقیاس‌پذیرها بالاتر از غول‌های نئوکلاد و نئوکلادهای نوظهور است زیرا ابرمقیاس‌پذیرها عمدتاً به بازار سازمانی خدمت می‌کنند.
  11. Oracle با یکی از پایین‌ترین قیمت‌های اجاره GPU در میان ابرمقیاس‌پذیرها عرضه می‌شود.
  12. در میان ابرهای GPU که از نظر فنی بسیار توانمند هستند، Nebius کمترین قیمت مطلق و بهترین شرایط را برای اجاره‌های کوتاه تا میان‌مدت ارائه می‌دهد. Crusoe نیز علاوه بر شایستگی فنی قوی، قیمت‌گذاری و شرایط قرارداد معقولی را ارائه می‌دهد.
  13. همانطور که اولین بار در مقاله ما در مورد اقتصاد ابر GPU که در دسامبر ۲۰۲۳ منتشر شد بحث کردیم، بهبودهای فناورانه به این معنی است که هزینه محاسبات به مرور زمان کاهش می‌یابد و اکنون معتقدیم که بازار به نفع خریداران GPUهای اجاره‌ای است. ۱۰۰ ابر GPU وجود دارد که همگی برای عمدتاً همان مشتریان رقابت می‌کنند.
  14. راه‌اندازی DeepSeek باعث تثبیت کوتاه‌مدت و حتی افزایش قیمت اجاره H200 شد، اما در میان‌مدت تا بلندمدت، قیمت‌ها همچنان در حال کاهش هستند.
  15. جنسن هوانگ، مدیر عامل انویدیا و به تعبیری "نابودگر ارشد درآمد"، هفته گذشته گفت: «وقتی Blackwellها به حجم انبوه شروع به عرضه کنند، حتی نمی‌توانید Hopperها را رایگان بدهید.» از دیدگاه اپراتور GPU، این باید هشداری برای ارائه‌دهندگان اجاره GPU باشد تا اطمینان حاصل کنند که قراردادهایی را منعقد می‌کنند که آنها را از کاهش سریع قیمت محاسبات محافظت می‌کند – یعنی تا حد امکان قراردادهای بلندمدت امضا کنند. از دیدگاه مشتری، آنها ممکن است انعطاف‌پذیری در تعهدات خود را ترجیح دهند و قراردادهای کوتاه‌مدت را انتخاب کنند.
  16. در پایان مقاله بیشتر در مورد قیمت‌گذاری اجاره GPU و نرخ بازده داخلی (IRR) GPUها و همچنین نرخ‌های اخیر بازار اجاره GPU برای طول‌های مختلف قرارداد صحبت خواهیم کرد. اگر خواننده‌ای هستید که عمدتاً به جنبه مالی GPUها

ClusterMAX™ – سیستم رتبه‌بندی برای ابرهای GPU

ClusterMAX™ اولین سیستم رتبه‌بندی ابر GPU مستقل در جهان است. ما ده‌ها ابر GPU را آزمایش کرده‌ایم و با صدها مشتری این ابرها صحبت کرده‌ایم تا این سیستم رتبه‌بندی را ایجاد کنیم. ClusterMAX™ بر اساس بازخورد و تجربه دست اول توسعه یافته است. این یک چارچوب مبتنی بر تجربه و تخصص گسترده ما در صنعت است. سیستم رتبه‌بندی ClusterMAX™ به‌طور مستقل توسط SemiAnalysis توسعه یافته است. ما بازخورد مشتریان را دریافت می‌کنیم و در برخی موارد، خودمان از GPUهای ابری استفاده کرده‌ایم. در حالی که ما روابط تجاری با بسیاری از ارائه‌دهندگان GPU داریم، هیچ بخشی از پاداش SemiAnalysis به‌طور مستقیم یا غیرمستقیم به رتبه‌بندی‌ها، امتیازات یا نظرات خاص بیان‌شده در این گزارش مرتبط نیست.

ما معتقدیم که استاندارد فعلی برای ابرهای GPU بسیار پایین است. بسیاری از ارائه‌دهندگان ابر GPU وجود دارند که به سادگی GPUهای خود را به مشتریان اجاره می‌دهند و کمترین تلاش را برای ارائه یک تجربه مشتری با کیفیت بالا انجام می‌دهند. هدف ClusterMAX™ ارائه مجموعه‌ای از دستورالعمل‌ها برای کمک به بالا بردن استاندارد برای کل صنعت ابر GPU است. ClusterMAX™ پنج سطح دارد: پلاتینیوم، طلا، نقره، برنز و عملکرد ضعیف.

معیارهای رتبه‌بندی ClusterMAX™ - SemiAnalysis
منبع: SemiAnalysis

ما معتقدیم که معیارهای ارزیابی که استفاده کرده‌ایم، آنچه را که مشتریان متوسط ابر GPU به دنبال آن هستند، منعکس می‌کند:

  • شبکه (Networking): تأخیر و پهنای باند شبکه اتصال داخلی (Interconnect) برای اکثر مشتریان، به ویژه آنهایی که به خوشه‌های بزرگ برای آموزش نیاز دارند، اهمیت دارد. ما شبکه را با استفاده از تست‌های NCCL و همچنین اجرای بارهای کاری واقعی ارزیابی می‌کنیم.
  • پشته نرم‌افزار / API: سهولت استفاده و گستردگی عملکرد پشته نرم‌افزار / API مهم است. ما ارزیابی می‌کنیم که راه‌اندازی یک خوشه GPU با استفاده از پشته نرم‌افزار / API چقدر آسان است.
  • زمان کارکرد / پایداری: زمان کارکرد، پایداری و توافق‌نامه سطح خدمات (SLA) برای اکثر مشتریان حیاتی است. ما این را بر اساس آزمایش و بازخورد مشتریان ارزیابی می‌کنیم.
  • پشتیبانی مشتری: در دسترس بودن و کیفیت پشتیبانی مشتری در صورتی که چیزی اشتباه شود، مهم است.
  • مقیاس‌پذیری: توانایی مقیاس‌پذیری سریع در هنگام نیاز مشتریان مهم است.
  • قیمت‌گذاری: قیمت‌گذاری، به ویژه قیمت در مقابل عملکرد، مهم است.
  • امنیت و انطباق: اقدامات امنیتی و گواهی‌نامه‌های انطباق (مانند SOC2، HIPAA) برای برخی مشتریان مهم است.

برای اینکه یک ارائه‌دهنده ابر GPU بتواند در یک رده خاص قرار گیرد، باید تمام معیارهای آن رده را برآورده کند. به عنوان مثال، برای دریافت رتبه ClusterMAX™ Platinum، یک ارائه‌دهنده ابر GPU باید در تمام معیارهای Platinum برتر باشد. اگر در هر یک از معیارها کوتاهی کند، به رده پایین‌تر منتقل می‌شود.

این امر منجر به برخی موقعیت‌های جالب می‌شود که در آن ارائه‌دهندگان ابر GPU که در اکثر معیارها قوی هستند، اما در یک یا دو معیار کلیدی ضعیف عمل می‌کنند، رتبه پایین‌تری نسبت به آنچه انتظار می‌رود دریافت می‌کنند. به عنوان مثال، Microsoft Azure و Google Cloud هر دو دارای نقاط قوت قابل توجهی هستند، اما به دلیل مشکلاتشان در معیار زمان کارکرد / پایداری، به ترتیب به ClusterMAX™ Gold و ClusterMAX™ Bronze تنزل یافته‌اند.

ما در نظر داریم تمرینات رتبه‌بندی ClusterMAX™ را هر ۳-۶ ماه یکبار انجام دهیم. این به ما امکان می‌دهد تا پیشرفت ارائه‌دهندگان مختلف GPU را منعکس کنیم و به مشتریان آخرین اطلاعات در مورد ابرهای GPU را ارائه دهیم. ما معتقدیم که این امر ارائه‌دهندگان ابر GPU را تشویق می‌کند تا به بهبود خدمات خود ادامه دهند.

معیارهای رتبه پلاتینیوم ClusterMAX™ - SemiAnalysis
منبع: SemiAnalysis

ClusterMAX™ Platinum

ClusterMAX™ Platinum بالاترین رتبه در سیستم رتبه‌بندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا می‌شود که در تمام معیارها عالی هستند. این ابرها استاندارد صنعت را تعیین می‌کنند و بهترین تجربه ممکن را برای مشتریان ارائه می‌دهند.

در حال حاضر، تنها یک ارائه‌دهنده ابر GPU وجود دارد که به رتبه ClusterMAX™ Platinum دست یافته است: CoreWeave. CoreWeave یک شبکه بسیار قوی، پشته نرم‌افزار / API عالی، زمان کارکرد / پایداری بالا، پشتیبانی مشتری عالی، مقیاس‌پذیری خوب و قیمت‌گذاری رقابتی را ارائه می‌دهد.

CoreWeave همچنین در بهره‌برداری از خوشه‌های H100 در مقیاس بزرگ (بیش از ۱۰ هزار GPU) تجربه قابل توجهی دارد و این امر آنها را به گزینه‌ای جذاب برای شرکت‌هایی تبدیل می‌کند که به دنبال آموزش مدل‌های زبانی بزرگ (LLM) پیشرفته هستند.

معیارهای رتبه طلایی ClusterMAX™ - SemiAnalysis
منبع: SemiAnalysis

ClusterMAX™ Gold

ClusterMAX™ Gold دومین رتبه برتر در سیستم رتبه‌بندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا می‌شود که در اکثر معیارها قوی هستند، اما ممکن است در یک یا دو زمینه دارای نقص‌های جزئی باشند.

ارائه‌دهندگانی که رتبه ClusterMAX™ Gold را دریافت کرده‌اند عبارتند از Microsoft Azure، Oracle Cloud Infrastructure (OCI)، AWS، Nebius AI و Crusoe Energy. این ارائه‌دهندگان خدمات بسیار خوبی را ارائه می‌دهند، اما دارای برخی اشکالات جزئی هستند که آنها را از دستیابی به رتبه Platinum باز می‌دارد. به عنوان مثال، Azure به دلیل مشکلات زمان کارکرد/پایداری‌اش به Gold تنزل یافته است.

معیارهای رتبه نقره‌ای ClusterMAX™ - SemiAnalysis
منبع: SemiAnalysis

ClusterMAX™ Silver

ClusterMAX™ Silver سومین رتبه برتر در سیستم رتبه‌بندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا می‌شود که از نظر فنی شایسته هستند و معمولاً برای خوشه‌های بزرگ قابل اعتماد هستند، اما فاقد برخی از ویژگی‌ها یا قابلیت‌های پیشرفته‌تر هستند. به طور کلی، شرکت های بزرگ GPU ها را در خوشه های بزرگ از ابرهای ClusterMAX™ Silver اجاره نمی کنند. ابرهای Silver، ابرهایی عالی برای اجاره GPU در مقیاس کوچکتر و همچنین راه اندازی هستند. رقبای ClusterMAX™ Silver عبارتند از Lambda، Fluidstack، Paperspace، VAST.AI و RunPod.

معیارهای رتبه برنزی ClusterMAX™ - SemiAnalysis
منبع: SemiAnalysis

ClusterMAX™ Bronze

ClusterMAX™ Bronze چهارمین رتبه برتر در سیستم رتبه‌بندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا می‌شود که از نظر فنی شایسته هستند اما مشکلات عملکرد قابل توجهی دارند. به طور کلی، شرکت های بزرگ GPU ها را از ابرهای ClusterMAX™ Bronze اجاره نمی کنند. ClusterMAX™ Bronze در حال حاضر فقط شامل Google Cloud است. ابرهای برنزی، ابرهایی عالی برای نمونه‌سازی اولیه، یا کارهای کوچک هستند. این بدان دلیل است که آنها ممکن است برای خوشه‌های بزرگ یا مدل‌های پیشرفته GPU ناپایدار باشند.

با این حال، ما فکر می‌کنیم Google Cloud در حال تلاش جدی برای انتقال به سطوح بالاتر است. ما معتقدیم Google Cloud در زمان ارزیابی مجدد بعدی ما در مسیر سریعی به سمت ClusterMAX™ Gold یا ClusterMAX™ Platinum قرار دارد.

معیارهای رتبه عملکرد ضعیف ClusterMAX™ - SemiAnalysis
منبع: SemiAnalysis

ClusterMAX™ UnderPerform

ClusterMAX™ Underperform پایین ترین رتبه در سیستم رتبه بندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا می‌شود که مشکلات عملکرد قابل توجهی دارند و توصیه نمی‌شود. به طور کلی، شرکت های بزرگ GPU ها را از ابرهای ClusterMAX™ Underperform اجاره نمی کنند. ابرهای عملکرد ضعیف، ابرهایی هستند که اجاره را در آنها توصیه نمی کنیم. در حال حاضر، ClusterMAX™ Underperform شامل Corellium، Vultr، Hetzner، Contabo، OVH، Scaleway و vast.ai است (ممکن است چند مورد برای VAST متفاوت باشد). به طور کلی، این ابرهای عملکرد ضعیف دارای زمان کارکرد یا قابلیت مقیاس پذیری پایینی هستند. ما به سادگی به هیچ کس توصیه نمی کنیم GPU ها را از این ابرهای عملکرد ضعیف اجاره کند.

اکوسیستم Coreweave و روابط آن با بازیگران مختلف
Coreweave به عنوان یک شرکت متخصص با اکوسیستم مناسب

Coreweave

Coreweave یک شرکت متخصص است که فقط برای رایانش با GPU ساخته شده است. این شرکت توسط بنیانگذاران بسیار فنی ساخته شده است که درک خوبی از آنچه مشتریان با GPU به آن اهمیت می‌دهند، دارند. Coreweave در زمینه رایانش با GPU تخصص دارد، به این معنی که به جای تلاش برای ارائه طیف گسترده‌ای از خدمات، می‌تواند تمام تلاش خود را بر ارائه بهترین تجربه ممکن برای مشتریان خود متمرکز کند.

برخی ممکن است بحث کنند که چگونه Coreweave توانسته است بسیاری از این مزیت‌ها را کسب کند، که بسیاری از آنها به توانایی ادغام مزیت رقابتی اصلی در سراسر اکوسیستم و روابط مرتبط با آن مرتبط است. این امر از طریق موارد زیر به دست می‌آید:

  • جمع‌آوری و نگهداری مستمر کارکنان با استعداد برای اجرای ابتکارات لازم.
  • تطبیق منابع مالی در خط، و ارائه آن به هر فرصتی برای رشد.
  • ادغام مزایای رقابتی اصلی در سراسر اکوسیستم، که به یک موتور ماندگار تبدیل می‌شود که از طریق آن مزایای جدید همیشه در حال توسعه هستند.

توانایی ادغام این موارد یک عنصر کلیدی برای Coreweave است که به آنها اجازه می دهد از سایر بازیگران به عنوان یک بازیگر خاص خارج شوند.

نئوکلاد و ابرمقیاس‌پذیرها: تفاوت

ابر مقیاس‌پذیرها شرکت‌هایی هستند که زیرساخت‌های رایانشی در مقیاس بزرگ ارائه می‌دهند. این شرکت‌ها معمولاً طیف گسترده‌ای از خدمات از جمله رایانش، ذخیره‌سازی و شبکه‌سازی را ارائه می‌دهند. ابر مقیاس‌پذیرها معمولاً شرکت‌های بزرگی هستند که منابع زیادی برای سرمایه‌گذاری در زیرساخت دارند. برخی از نمونه‌ها عبارتند از Amazon Web Services (AWS)، Microsoft Azure و Google Cloud Platform (GCP).

نئوکلادها شرکت‌های کوچکتری هستند که زیرساخت‌های رایانشی تخصصی ارائه می‌دهند. این شرکت‌ها معمولاً بر روی یک نوع خاص از رایانش مانند رایانش با GPU یا رایانش با عملکرد بالا تمرکز دارند. نئوکلادها معمولاً شرکت‌های چابکتری هستند که می‌توانند به سرعت به تغییرات بازار پاسخ دهند.

قیمت‌گذاری: ابرمقیاس‌پذیر در مقابل نئوکلاد

قیمت‌گذاری اجاره GPU برای ابرمقیاس‌پذیرها و نئوکلادها بسته به عوامل مختلفی متفاوت است. چند عامل کلیدی که می‌تواند قیمت را تحت تأثیر قرار دهد عبارتند از نوع GPU، مدت زمان اجاره و میزان محاسبات مورد نیاز.

در حالت کلی، قیمت‌گذاری ابرمقیاس‌پذیرها برای اجاره GPU در مقایسه با نئوکلادها بالاتر است. این به این دلیل است که ابرمقیاس‌پذیرها معمولاً به بازار سازمانی خدمت می‌کنند که مایل به پرداخت هزینه بیشتر برای SLA، امنیت و انطباق بالاست. نئوکلادها اغلب گزینه‌های مقرون به صرفه‌تری را ارائه می‌دهند، اما ممکن است از نظر SLA، امنیت و انطباق قابلیت اطمینان کمتری داشته باشند.

قیمت‌گذاری اغلب بسته به نوع GPU نیز متفاوت است. جدیدترین و قدرتمندترین GPUها گران‌ترین اجاره هستند، در حالی که GPUهای قدیمی‌تر و کم‌قدرت‌تر معمولاً گزینه‌های مقرون به صرفه‌تری هستند. به عنوان مثال، اجاره یک Nvidia H100 گران‌تر از یک Nvidia A100 خواهد بود.

علاوه بر این، قیمت‌ها بر اساس مدت زمان اجاره متفاوت است. اجاره‌های کوتاه‌مدت معمولاً گران‌تر از اجاره‌های بلندمدت هستند، زیرا ارائه‌دهندگان باید هزینه نگهداری و استهلاک سخت‌افزار را جبران کنند.

Oracle Cloud با یکی از کمترین قیمت‌های اجاره GPU در بین مقیاس‌پذیرها
منبع: Oracle

به‌روزرسانی قیمت 3/26/2025

در میان مقیاس‌پذیرها، Oracle با قیمت رقابتی عرضه می‌شود. به ویژه، Oracle Cloud دارای یکی از پایین‌ترین قیمت‌های اجاره GPU است. ما معتقدیم Oracle جدی است و به همین دلیل است که رتبه Gold را دریافت کرده است.

وضعیت فعلی تقاضا: DeepSeek تثبیت و حتی افزایش قیمت‌ها را باعث شد

راه‌اندازی DeepSeek باعث تثبیت کوتاه‌مدت و حتی افزایش قیمت اجاره H200 شد. اگر به خاطر داشته باشید، DeepSeek یک شرکت چینی است که یک مدل زبانی بزرگ (LLM) را راه‌اندازی کرد که رقبای خود را از نظر دقت در معیارها شکست داد. در نتیجه، تقاضا برای GPUهای محاسباتی بالارده برای آموزش این مدل زبانی بزرگ به طور ناگهانی افزایش یافت.

اما در میان‌مدت تا بلندمدت، قیمت‌ها همچنان در حال کاهش هستند. این به این دلیل است که تعداد فزاینده‌ای از GPUهای محاسباتی در دسترس قرار می‌گیرند. با این حال، هنوز تعداد کمی از شرکت‌ها وجود دارند که در حال حاضر خوشه‌های 8K GPU یا 10K GPU را برای مقیاس مورد نیاز و مقرون به صرفه مستقر کرده‌اند.

وضعیت فعلی عرضه

همانطور که قبلاً اشاره کردیم، در حال حاضر بیش از 100 نئوکلاد به عنوان ارائه‌دهنده اجاره GPU در دسترس هستند. به طور کلی، بازار از عدم اطمینان بیش از حد رنج می برد. شرکت ها می ترسند خود را ملزم به خرید بلندمدت یا قراردادهای بلندمدت کنند، زیرا می دانند قیمت GPU محاسباتی در طول زمان کاهش می یابد. جنسن هوانگ، مدیر عامل انویدیا و به تعبیری "نابودگر ارشد درآمد"، هفته گذشته گفت: «وقتی Blackwellها به حجم انبوه شروع به عرضه کنند، حتی نمی‌توانید Hopperها را رایگان بدهید.»

از دیدگاه اپراتور GPU، این باید هشداری برای ارائه‌دهندگان اجاره GPU باشد تا اطمینان حاصل کنند که قراردادهایی را منعقد می‌کنند که آنها را از کاهش سریع قیمت محاسبات محافظت می‌کند – یعنی تا حد امکان قراردادهای بلندمدت امضا کنند. از دیدگاه مشتری، آنها ممکن است انعطاف‌پذیری در تعهدات خود را ترجیح دهند و قراردادهای کوتاه‌مدت را انتخاب کنند.

توصیه ها برای مشتریان

توصیه شماره 1 این است که قبل از خرید، خرید کنید. به یاد داشته باشید، بازار برای ارائه‌دهندگان اجاره GPU رقابتی است و به طور کلی به نفع مشتریان است. در حال حاضر 100 ابر GPU با عمدتاً همان مشتریان در رقابت هستند. به طور کلی، در حال حاضر، ما معتقدیم که بهتر است انعطاف‌پذیری در تعهدات خود داشته باشید و به قراردادهای کوتاه‌مدت پایبند باشید تا از کاهش قیمت اجاره GPU جلوگیری شود. توصیه شماره 2 این است که هر بار یک دسته کامل را با یک شرکت به صورت آزمایشی اجاره نکنید. هر کدام را امتحان کنید تا بفهمید کدامیک برای شما بهتر عمل می کند.

نکته دیگری که در نظر گرفته می شود، به ویژه اگر نیاز دارید حجم زیادی از GPU ها را مدیریت کنید، انتخاب ClusterMAX™ Platinum و Gold است. نکته دیگر این است که ما در این مقاله به قیمت دسترسی نداریم، با این حال، در بین نئوکلادهایی که بسیار خوب هستند، Nebius کمترین قیمت و بهترین شرایط را دارد. اگر می‌خواهید با یک ابر در اندازه و مقیاس کوچکتر با ارائه‌دهنده اصلی ابرمقیاس‌پذیر همراه شوید، می‌توانید با Crusoe بروید. ارائه‌دهندگان بسیار بزرگی مانند Amazon Web Services AWS، Google Cloud و Microsoft Azure در حال حاضر، کمترین عملکرد را برای مبلغ درخواستی خود در این مرحله ارائه می‌دهند، در حالی که خدمات مناسبی ارائه می‌دهند.

آینده این بخش و Coreweave

بر اساس مدل سازی های گذشته ما از این بخش، که در گزارش اقتصاد ابر GPU منتشر شد، می توانیم تأیید کنیم که بر اساس عملکرد فعلی، این بخش و Coreweave شایسته در نظر گرفته شدن به عنوان یک سرمایه گذاری بسیار قوی هستند. با این حال، برای ادامه این روند، آنها باید به ایجاد مزیت رقابتی اصلی که به درستی ایجاد شده است ادامه دهند. این نه تنها باید ادامه یابد، بلکه باید برای ادغام کامل در سراسر اکوسیستم مرتبط با آن استفاده شود.

در حالی که ارزش بخش و عملکرد Coreweave بر اساس داده های گذشته امیدوارکننده است، این تنها به شرطی ادامه خواهد یافت که تیم بهینه سازی های لازم را در کل بخش انجام دهد. این به معنای ادامه ساخت، نگهداری، تکرار و افزایش مقیاس کل این بخش است. به طور کلی، باید رویکرد فعلی و تعهد برای انطباق را اتخاذ کرد. به یاد داشته باشید، نوآوری و بهینه سازی در انحصار هیچ کس نیست.

نحوه ارزیابی یک GPU اجاره‌ای – هزینه کل مالکیت، IRR و تجزیه و تحلیل سناریو

حالا می خواهیم کمی ریاضیات برای مدل اقتصادی خوشه GPU اجاره کنیم. تکرار می کنیم که برای راحتی همه چیز را بیش از حد ساده کرده ایم.

به طور کلی، ما به سه جزء اصلی نگاه می‌کنیم:

  1. هزینه اولیه سرمایه، اجاره ماهیانه سرور و هزینه برق
  2. هزینه تمام شده، اجاره، هزینه نیروی کار، هزینه عملیات و نگهداری
  3. درآمد، بهره‌وری و تداوم

به طور کلی، ما به نرخ بازده داخلی (IRR) هدف 15٪ یا بیشتر نگاه می کنیم. برخی از معیارها و فرضیاتی که مورد بررسی قرار می گیرند در زیر شرح داده شده است:

  • متوسط قیمت فروش سرور، 50000 دلار
  • هزینه برق با 7 سنت در هر کیلووات ساعت
  • نرخ استهلاک، 5 سال
  • زمان اجاره، هر سرور 24/7
  • حاشیه عملیاتی 15 درصدی برای هر سرور

یک تحلیل خوب و سریع به این صورت است:

  • درآمد با 2075 دلار در ماه
  • هزینه برق در هر ماه با 300 دلار
  • نرخ بازده داخلی، 17.4 درصد

در حالی که اینها نتایج امیدوارکننده ای هستند، می بینیم که نرخ های اجاره سرور بالاتر از 2500 دلار در ماه هستند. برای بررسی بیشتر موضوع قیمت‌ها، ادامه مطلب را بخوانید.

نرخ اجاره بازار فعلی برای H100

وضعیت فعلی برای GPU های H100 80 گیگابایتی با NVLink در هر GPU در هر ساعت تقریباً به شرح زیر است:

  • حداقل یک سال اجاره، تقریباً 2.3 دلار
  • حداقل سه ماه اجاره، تقریباً 2.70 دلار
  • حداقل یک ماه اجاره، تقریباً 3.10 دلار
  • بدون تعهد، تقریباً 3.50 دلار

این منجر به هزینه موثر ماهانه تقریباً می‌شود

  • حداقل یک سال اجاره، تقریبا 1700 دلار
  • حداقل سه ماه اجاره، تقریباً 2000 دلار
  • حداقل یک ماه اجاره، تقریباً 2300 دلار
  • بدون تعهد، تقریباً 2600 دلار

همانطور که می بینیم، کاهش قیمت به نفع مشتری است که به طور کلی مایل به ارائه تعهد و پرداخت زودهنگام است. ما معتقدیم با گذشت زمان این قیمت‌ها کم می شوند. اینها برخی از جزئیات در مورد نرخ بازده داخلی و چشم انداز کلی اقتصادی اجاره سرور است.